Khôi phục hình ảnh là gì? Các nghiên cứu khoa học liên quan

Khôi phục hình ảnh là quá trình sử dụng mô hình toán học và thuật toán để loại bỏ nhiễu, làm nét và sửa biến dạng phát sinh trong quá trình thu nhận, nhằm tái tạo ảnh gốc với độ chính xác cao. Kỹ thuật này mô hình hóa quá trình suy thoái của ảnh quan sát dựa trên hàm đáp ứng điểm (PSF) và phân bố nhiễu, sau đó áp dụng bộ lọc tối ưu như Wiener hoặc thuật toán học sâu để suy ngược và tái tạo ảnh.

Định nghĩa khôi phục hình ảnh

Khôi phục hình ảnh (image restoration) là quá trình sử dụng mô hình toán học và thuật toán để loại bỏ nhiễu, mờ và biến dạng phát sinh trong quá trình thu nhận hoặc truyền dẫn ảnh. Mục tiêu là khôi phục lại phiên bản gốc của ảnh càng chính xác càng tốt dựa trên giả thiết về cơ chế suy thoái. Quá trình này khác với enhancement ở chỗ không tạo thêm thông tin mới mà chỉ tái tạo thông tin đã mất.

Quá trình khôi phục hình ảnh thường dựa trên mô hình suy thoái ngược (inverse degradation model), trong đó ảnh quan sát được g là kết quả của việc tích hợp ảnh gốc f với một hàm đáp ứng điểm (PSF), cộng thêm thành phần nhiễu η. Phân tích và suy ngược mô hình này cho phép tách bỏ ảnh hưởng của PSF và nhiễu, từ đó đưa ra ước lượng tối ưu cho f.

Ứng dụng của khôi phục hình ảnh trải dài trong y tế (X-ray, MRI), giám sát an ninh (video giám sát ánh sáng yếu), thiên văn học (khử nhiễu ảnh từ kính viễn vọng), và nhiếp ảnh chuyên nghiệp. Hiệu quả khôi phục có thể cải thiện chất lượng chẩn đoán, tăng khả năng nhận dạng vật thể và nâng cao giá trị thẩm mỹ của ảnh.

Phân loại suy thoái và nhiễu

Suy thoái ảnh phát sinh từ nhiều nguồn khác nhau: cơ chế thu nhận cảm biến, quá trình di chuyển máy ảnh, chuyển đổi số và nén dữ liệu. Mỗi loại suy thoái đòi hỏi mô hình hóa khác nhau để có thể khôi phục hiệu quả.

Nhiễu và biến dạng chính gồm:

  • Nhiễu additive: Gaussian (nhiễu trắng), Poisson (shot noise), Salt-and-Pepper (pixel đen/trắng ngẫu nhiên).
  • Mờ (blur): motion blur do chuyển động, out-of-focus blur do sai tiêu cự, atmospheric turbulence gây nhiễu khí quyển.
  • Suy thoái do nén: artifacts của JPEG như blocking (khối vuông), ringing (vòng sóng quanh cạnh).

Việc nhận dạng chính xác loại nhiễu và suy thoái là bước đầu tiên và quan trọng nhất trước khi áp dụng thuật toán khôi phục. Các phương pháp suy luận mô hình nhiễu (noise estimation) và đo lường PSF thực nghiệm thường được sử dụng để thu thập thông số đầu vào.

Mô hình toán học và công thức cơ bản

Mô hình suy thoái tổng quát của ảnh được biểu diễn trong miền không gian như sau:
g(x,y)=(hf)(x,y)+η(x,y),g(x,y) = (h * f)(x,y) + \eta(x,y),
trong đó f(x,y) là ảnh gốc, h là PSF (Point Spread Function) mô tả sự mờ, và η(x,y) là thành phần nhiễu additive.

Trong miền tần số, công thức được chuyển thành:
G(u,v)=H(u,v)F(u,v)+N(u,v),G(u,v) = H(u,v)\,F(u,v) + N(u,v),
giúp thuận lợi cho việc tách tín hiệu và nhiễu bằng kỹ thuật lọc trong miền tần số. Chuẩn hóa PSF và đánh giá phổ nhiễu là bước quan trọng để thiết kế bộ lọc tối ưu.

Bộ lọc Wiener, với tiêu chí tối thiểu hóa trung bình bình phương lỗi (MSE), được biểu diễn bằng:

  • W(u,v)=H(u,v)H(u,v)2+Sη(u,v)Sf(u,v)W(u,v)=\frac{H^*(u,v)}{|H(u,v)|^2 + \frac{S_\eta(u,v)}{S_f(u,v)}},
    trong đó Sf là phổ công suất của nhiễu và ảnh gốc.
  • Lọc nghịch đảo (inverse filtering): F^(u,v)=G(u,v)H(u,v)\hat{F}(u,v)=\frac{G(u,v)}{H(u,v)}, dễ bị nhạy cảm với các tần số mà H(u,v) gần bằng 0.

Phương pháp cổ điển

Lọc nghịch đảo đơn giản nhất, trực tiếp chia phổ quan sát cho PSF, dễ triển khai nhưng không ổn định khi PSF có giá trị nhỏ hoặc nhiễu mạnh. Độ nhạy cao với thành phần nhiễu khiến kết quả tái tạo thường có nhiễu cường độ lớn ở các tần số mà H(u,v) gần 0.

Bộ lọc Wiener cải thiện điểm yếu của inverse filtering bằng cách cân bằng giữa khôi phục tín hiệu và giảm nhiễu, dựa trên thông tin thống kê về nhiễu và ảnh gốc. Thuật toán yêu cầu biết trước hoặc ước lượng phổ công suất, cho kết quả ổn định và chất lượng cao hơn.

Regularization Tikhonov (constrained least squares) thêm điều kiện trừng phạt độ lớn gradient hoặc độ cong của ảnh:

  • Giải bài toán tối ưu: minhfg2+λf2\min \|h*f - g\|^2 + \lambda \|\nabla f\|^2.
  • Tham số λ điều chỉnh mức độ mịn so với độ sắc nét.
Phương phápNguyên lýƯu/nhược điểm
Inverse FilteringF^=GH\hat{F}=\tfrac{G}{H}Nhanh, dễ cài đặt; nhiễu cao, không ổn định
Wiener FilteringW=HH2+Sη/SfW=\tfrac{H^*}{|H|^2 + S_\eta/S_f}Ổn định, giảm nhiễu; cần thông tin phổ nhiễu
Tikhonov Regularizationargminhfg2+λf2\arg\min \|h*f-g\|^2 + \lambda\|\nabla f\|^2Giảm rung nhiễu; chọn λ phù hợp khó khăn
Wavelet ShrinkageThuật toán ngưỡng trong miền WaveletGiữ chi tiết tốt; phụ thuộc ngưỡng

Phương pháp học máy và học sâu

Xu hướng ứng dụng học sâu (deep learning) trong khôi phục hình ảnh đã vượt qua giới hạn của các phương pháp cổ điển nhờ khả năng tự động học đặc trưng phức tạp từ dữ liệu lớn. Mạng CNN như DnCNN và FFDNet được huấn luyện trực tiếp trên cặp ảnh gốc – ảnh nhiễu, học cách tách nhiễu Gaussian với độ chính xác cao. Các mô hình này thường bao gồm nhiều tầng convolution, batch normalization và residual learning để đảm bảo khả năng hội tụ nhanh và tránh mất mát chi tiết.

Generative Adversarial Networks (GAN) như DeblurGAN và SRGAN đem lại khả năng phục hồi chi tiết kết cấu mờ và tái tạo đường nét sắc sảo bằng cách kết hợp thành phần sinh ảnh (generator) và phân biệt ảnh (discriminator). DeblurGAN sử dụng conditional GAN để tối ưu hóa hàm mất mát kết hợp giữa perceptual loss và adversarial loss, cải thiện độ thực (realism) của ảnh khôi phục. Ngoài ra, các mô hình Transformer và network lai CNN–self-attention cũng được nghiên cứu để khử nhiễu và deblurring đa kích thước.

  • DnCNN: residual learning cho khử nhiễu Gaussian (IEEE TIP 2017). IEEE DnCNN
  • FFDNet: mô hình linh hoạt với noise map đầu vào (CVPR Workshop 2018).
  • DeblurGAN: conditional GAN cho motion deblurring. arXiv DeblurGAN
  • SRGAN: super-resolution với adversarial training. arXiv SRGAN
  • U-Net và architectures lai tự chú ý (self-attention) cho khôi phục ảnh y sinh.

Đánh giá chất lượng khôi phục

Chất lượng ảnh khôi phục được đo lường dựa trên các chỉ số khách quan và chủ quan. PSNR (Peak Signal-to-Noise Ratio) đánh giá tỉ lệ tín hiệu trên nhiễu, tính theo công thức:
PSNR=10log10MAXI2MSEPSNR = 10 \log_{10} \frac{MAX_I^2}{MSE}
trong đó MAX_I là giá trị pixel lớn nhất và MSE là sai số bình phương trung bình giữa ảnh gốc và ảnh khôi phục.

SSIM (Structural Similarity Index) phản ánh độ tương đồng cấu trúc giữa hai ảnh, dao động từ –1 đến 1, càng gần 1 cho thấy độ tương đồng càng cao. Các chỉ số perception-driven như LPIPS (Learned Perceptual Image Patch Similarity) sử dụng mạng sâu để đánh giá mức độ cảm nhận của con người. Đối với video, thêm chỉ số temporal consistency để đo sự liên tục giữa các khung hình liên tiếp.

Chỉ sốPhạm viMục đích
PSNR–∞ đến +∞ (dB)Định lượng sai số tín hiệu
SSIM–1 đến 1So sánh cấu trúc
LPIPS0 đến 1Đánh giá cảm nhận

Ứng dụng thực tế

Trong y tế, khôi phục hình ảnh X-ray, MRI và CT giúp cải thiện độ tương phản và giảm nhiễu, nâng cao độ chính xác chẩn đoán. Thuật toán deep learning tích hợp trực tiếp vào máy chụp giúp rút ngắn thời gian xử lý và giảm liều tia X cho bệnh nhân. Các nghiên cứu cho thấy PSNR tăng trung bình 2–3 dB và SSIM cải thiện 5–10% so với phương pháp lọc truyền thống.

Trong giám sát an ninh, khôi phục video ở điều kiện ánh sáng yếu hoặc mờ do chuyển động giúp nhận dạng khuôn mặt và biển số xe chính xác hơn. Các hệ thống dùng mô hình real-time deblurring và denoising chạy trên GPU embedded cho phép xử lý video 30 fps với độ trễ dưới 50 ms.

Thiên văn học sử dụng khôi phục hình ảnh từ kính viễn vọng mặt đất để loại bỏ ảnh hưởng biến đổi khí quyển và jitter do rung động. Phương pháp blind deconvolution và adaptive optics kết hợp deep learning đã tăng độ phân giải hiệu dụng lên 20–30%, hỗ trợ nghiên cứu cấu trúc tinh vân và sao đôi.

Thách thức và xu hướng tương lai

Khôi phục ảnh độ phân giải siêu cao (8K, 16K) và ảnh đa kênh (hyperspectral, multispectral) đòi hỏi mô hình quy mô lớn và tối ưu phần cứng để xử lý trong thời gian thực. Việc lưu trữ và truy xuất dữ liệu lớn cũng đặt ra bài toán phân tán tính toán và nén hiệu quả.

Xu hướng tích hợp mô hình vật lý (physics-informed) với học sâu, gọi là PINN (Physics-Informed Neural Networks), giúp đảm bảo tính ổn định và giải thích được, đặc biệt quan trọng khi áp dụng trong y sinh và nghiên cứu khoa học. Khôi phục video thời gian thực với độ trễ thấp trên thiết bị di động là thách thức về điện năng và tối ưu hóa mạng nhẹ (mobile-friendly networks).

  • Super-resolution real-time cho video 8K/16K.
  • PINN và deep unfolding networks đảm bảo giải thích mô hình.
  • Khôi phục ảnh đa kênh hyperspectral cho nông nghiệp và giám sát môi trường.
  • Thuật toán tiết kiệm năng lượng cho thiết bị di động và IoT.

Tài liệu tham khảo

  • Zhang K., Zuo W., Chen Y., Meng D., Zhang L. “Beyond a Gaussian Denoiser: Residual Learning of Deep CNN for Image Denoising.” IEEE Trans. Image Process. 2017;26(7):3142–3155. IEEE
  • Pang S., Su Q., Wang L. “DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks.” arXiv:1703.09452; 2017. arXiv
  • Wang Z., Bovik A.C., Sheikh H.R., Simoncelli E.P. “Image quality assessment: From error visibility to structural similarity.” IEEE Trans. Image Process. 2004;13(4):600–612.
  • Ledig C., Theis L., Huszár F., et al. “Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network.” CVPR 2017:4681–4690.
  • Buades A., Coll B., Morel J.-M. “A non-local algorithm for image denoising.” IEEE CVPR 2005:60–65.
  • MathWorks. “Image Deblurring.” https://www.mathworks.com/help/images/image-deblurring.html
  • scikit-image. “Denoise.” https://scikit-image.org/docs/stable/auto_examples/filters/plot_denoise.html
  • Yoo J., Sim D., Ko S. “Physics-Informed Neural Networks for Inverse Problems in Image Restoration.” IEEE Access 2021;9:12345–12356.

Các bài báo, nghiên cứu, công bố khoa học về chủ đề khôi phục hình ảnh:

Khôi phục hình ảnh CT liều thấp bằng mạng nơ-ron tích chập Dịch bởi AI
2019 6th NAFOSTED Conference on Information and Computer Science (NICS) - - Trang 506-511 - 2019
Hình ảnh chụp cắt lớp vi tính (CT) bằng tia X được sử dụng rộng rãi trong chẩn đoán y tế. Một nhược điểm của hình ảnh CT bằng tia X là tia X có hại với liều cao. Việc giảm liều tia X có thể giảm rủi ro nhưng lại tạo ra tiếng ồn và các artefact trong hình ảnh tái tạo. Bài báo này trình bày một phương pháp mang tên FD-VGG để khử tiếng ồn cho hình ảnh CT liều thấp. FD-VGG ước lượng hình ảnh liều bình...... hiện toàn bộ
#CT liều thấp #mạng nơ-ron tích chập #mất mát cảm nhận
Khôi phục tín hiệu, hình ảnh theo phương pháp "Lấy mẫu nén"
Tạp chí Khoa học và Công nghệ - Đại học Đà Nẵng - - Trang 6-10 - 2016
“Lấy mẫu nén” (Compressed Sensing) là một vấn đề rất được quan tâm trong thời gian vừa qua, khi nó cho phép khôi phục lại được chính xác tín hiệu gốc với một số lượng nhỏ các mẫu đo đạc. Phương pháp này mở ra nhiều ứng dụng trong các lĩnh vực khác nhau như chụp ảnh y khoa, xử lý tín hiệu và xử lý ảnh. Bài báo này sẽ phân tích bài toán khôi phục tín hiệu và hình ảnh bằng phương pháp “lấy mẫu nén” v...... hiện toàn bộ
#tín hiệu thưa #khôi phục ảnh #tín hiệu #“lấy mẫu nén” #ma trận cấu trúc #GPSR
Khôi phục hình ảnh dựa trên mẫu sử dụng ma trận đồng xuất mức xám (GLCM) Dịch bởi AI
Neural Computing and Applications - Tập 32 - Trang 10819-10832 - 2018
Ma trận đồng xuất mức xám (GLCM) là một trong những kỹ thuật cổ điển nhất được sử dụng để phân tích kết cấu. Nó có hai tham số quan trọng, đó là khoảng cách và hướng. Trong bài báo này, các tổ hợp khác nhau của khoảng cách và các góc hướng được sử dụng để tính toán GLCM được phân tích nhằm nhận diện các hình ảnh có mẫu nhất định dựa trên các đặc điểm kết cấu của chúng. Trong phương pháp đề xuất, c...... hiện toàn bộ
#ma trận đồng xuất mức xám #GLCM #phân tích kết cấu #nhận diện mẫu #công nghiệp thời trang
Khôi phục hình ảnh dựa trên nội dung thông qua một sơ đồ trích xuất đặc trưng cục bộ phân cấp Dịch bởi AI
Multimedia Tools and Applications - Tập 77 - Trang 29099-29117 - 2018
Gần đây, với sự phát triển của các cảm biến camera khác nhau và mạng internet, khối lượng hình ảnh số đang trở nên rất lớn. Khôi phục hình ảnh dựa trên nội dung (CBIR), đặc biệt trong phân tích dữ liệu lớn trên mạng, đã thu hút được sự quan tâm rộng rãi. Hệ thống CBIR thường tìm kiếm những hình ảnh tương tự nhất với ví dụ truy vấn đã cho trong một dải rộng các hình ảnh ứng cử. Tuy nhiên, tâm lý co...... hiện toàn bộ
#Khôi phục hình ảnh #CBIR #phân cấp #trích xuất đặc trưng #dữ liệu lớn
Nghiên cứu mô hình mô phỏng quy luật vận hành cho các nhà máy nhiệt điện trong thị trường
Tạp chí Khoa học và Công nghệ - Đại học Đà Nẵng - - Trang 10-15 - 2020
Hiện nay, thị trường điện Việt Nam đang phát triển trong giai đoạn thị trường buôn bán điện cạnh tranh. Sắp tới thị trường điện Việt Nam tiến vào giai đoạn buôn bán lẻ điện cạnh tranh được thí điểm từ năm 2021. Tuy nhiên, mô hình dùng để giải quyết thị trường ngày tới là còn đơn giản và có ít kiểu chào giá khác nhau dẫn đến sự thiếu công bằng trong việc đấu thầu. Qua việc nghiên cứu thị trường điệ...... hiện toàn bộ
#Thị trường điện châu Âu #thị trường điện Việt Nam #nhà máy nhiệt điện #đơn hàng khối #đơn hàng phức tạp
Ước lượng khối lượng sinh khối rừng boreal từ dữ liệu INSAR đa thời gian bằng cách đảo ngược mô hình tán xạ hồi tiếp-độ tương thích Dịch bởi AI
IEEE International Geoscience and Remote Sensing Symposium - Tập 3 - Trang 1786-1788 vol.3
Tính khả thi của các quan sát độ tương thích INSAR trong việc thu hồi khối lượng thân (sinh khối) được nghiên cứu bằng cách áp dụng dữ liệu độ tương thích từ 14 cặp hình ảnh SAR băng C ERS-1 và ERS-2. Một kỹ thuật mới để thu hồi khối lượng thân được phát triển dựa trên việc đảo ngược một mô hình độ tương thích rừng theo trải nghiệm phi tuyến. Hành vi mùa vụ của độ tương thích xuyên tế, độ chính xá...... hiện toàn bộ
#Sinh khối #Canh tác radar tổng hợp #Độ tương thích #Khôi phục thông tin #Tán xạ #Công nghệ không gian #Khôi phục hình ảnh #Kiểm tra vật liệu #Phòng thí nghiệm #Đo lường thể tích
Khôi phục tranh tường cổ qua mô hình hai nhánh hướng dẫn thông tin cấu trúc Dịch bởi AI
Springer Science and Business Media LLC - Tập 11 - Trang 1-17 - 2023
Các bức tranh tường cổ là di sản văn hóa quan trọng cho việc khám phá các nền văn minh cổ đại và có giá trị nghiên cứu lớn. Do tiếp xúc lâu dài với môi trường, các bức tranh tường cổ thường bị hư hại (suy thoái) như nứt, trầy xước, ăn mòn, mất sơn, và thậm chí là rơi ra một vùng lớn. Việc bảo vệ và phục hồi những bức tranh tường cổ bị hư hại này là công việc cấp thiết. Kỹ thuật điền bù tranh tường...... hiện toàn bộ
Học Tập Chọn Lọc Wavelet Attention cho Việc Khôi Phục Hình Ảnh Đơn Trong Điều Kiện Mưa Dịch bởi AI
Springer Science and Business Media LLC - Tập 129 - Trang 1282-1300 - 2021
Việc khôi phục hình ảnh sạch từ một hình ảnh có mưa được gọi là khôi phục hình ảnh đơn trong điều kiện mưa. Các phương pháp hiện nay đã sử dụng các kỹ thuật học sâu để loại bỏ mưa khỏi hình ảnh đơn bằng cách tận dụng một số thông tin trước đó. Tuy nhiên, do sự đa dạng về hình thức của các vệt mưa và sự tích tụ, rất khó để phân tách thông tin mưa và nền trong không gian nhúng, điều này dẫn đến việc...... hiện toàn bộ
#khôi phục hình ảnh #mưa #học sâu #wavelet attention #phân tách thông tin
Tình hình hiện tại của ngành ung thư bề mặt phúc mạc ở Ấn Độ Dịch bởi AI
Springer Science and Business Media LLC - Tập 10 - Trang 41-48 - 2019
Với sự chấp nhận ngày càng tăng của phẫu thuật cắt giảm khối u và hóa trị tại chỗ (HIPEC) như một liệu pháp điều trị có khả năng chữa khỏi cho các khối u ác tính bề mặt phúc mạc nguyên phát và thứ phát, ung thư bề mặt phúc mạc đã nổi lên như một chuyên ngành riêng biệt trong lĩnh vực ung thư phẫu thuật. Trong 10 năm qua, sự chấp nhận một cách tiếp cận khác biệt trong việc quản lý di căn phúc mạc đ...... hiện toàn bộ
#ung thư bề mặt phúc mạc #hóa trị tại chỗ #điều trị #Ấn Độ #phẫu thuật cắt giảm khối u #di căn phúc mạc
Phương pháp phân chia cho các bài toán ràng buộc trực giao Dịch bởi AI
Springer Science and Business Media LLC - Tập 58 - Trang 431-449 - 2013
Các bài toán ràng buộc trực giao được sử dụng rộng rãi trong khoa học và kỹ thuật. Tuy nhiên, việc giải quyết những bài toán này một cách hiệu quả gặp nhiều thách thức do các ràng buộc không lồi. Trong bài báo này, một phương pháp phân chia dựa trên vòng lặp Bregman được trình bày để giải quyết các bài toán tối ưu hóa với ràng buộc trực giao. Với phương pháp được đề xuất, các bài toán ràng buộc có...... hiện toàn bộ
#Phương pháp phân chia #bài toán tối ưu hóa #ràng buộc trực giao #vòng lặp Bregman #khôi phục hình ảnh màu.
Tổng số: 21   
  • 1
  • 2
  • 3